1
Os Fundamentos da Aproximação por Norma
MATH008Lesson 6
00:00
Imaginemos que você é um alfaiate tentando ajustar um terno padrão (o espaço gerado por $A$) a um cliente com proporções únicas (o vetor $b$). Não importa quão bem você ajuste as mangas ou a cintura (os coeficientes $x$), o terno nunca será um ajuste perfeito. Você está procurando o "melhor" compromisso — uma aproximação por norma que minimiza a tensão ou o "resíduo" em cada costura.

O Quadro Matemático

O objetivo central é encontrar um vetor $x \in \mathbb{R}^n$ tal que a combinação linear $Ax = x_1a_1 + \dots + x_na_n$ melhor aproxime $b$. Isso é frequentemente referido como a regressão de $b$ sobre os regressores (as colunas de $A$).

Focamos no vetor de resíduos $r = Ax - b$. Na prática, assumimos um sistema sobredeterminado onde $m > n$. Por quê? Porque quando $m = n$ e $A$ é não singular, o ponto ótimo é simplesmente $A^{-1}b$, resultando em erro zero — um caso trivial para otimização.

🎯 Princípio Fundamental
O problema de aproximação por norma (6.1) é um problema convexo e é garantido ser solucionável. Sempre existe pelo menos uma solução ótima $\hat{x}$ que minimiza a distância entre o alvo e o subespaço alcançável.

Variações Canônicas

Dependendo do "tipo" de erro que queremos penalizar, escolhemos diferentes normas:

1. Mínimos Quadrados ($\ell_2$)

A abordagem mais comum. Minimiza a soma dos quadrados dos resíduos: $\|Ax - b\|_2^2$. É sensível a grandes valores discrepantes, mas oferece uma solução analítica através das equações normais.

2. Chebyshev / Minimax ($\ell_\infty$)

Minimiza o máximo absoluto $\max_i |r_i|$. É usado quando cada medição individual deve permanecer dentro de uma tolerância estrita. Pode ser resolvido por meio do seguinte Programa Linear (PL):

minimize $t$
sujeito a $-t\mathbf{1} \preceq Ax - b \preceq t\mathbf{1}$

3. Soma dos Valores Absolutos dos Resíduos ($\ell_1$)

Minimiza $\sum |r_i|$. Essa abordagem é robusta a valores discrepantes, pois não eleva ao quadrado os erros. Também pode ser resolvida por meio de um PL:

minimize $\mathbf{1}^T t$
sujeito a $-t \preceq Ax - b \preceq t$

Contexto de Estimação

Em muitas áreas da engenharia, assumimos que um estado verdadeiro $x$ é obscurecido por ruído: $y = Ax + v$. Nosso objetivo é encontrar uma estimativa $\hat{x} = \text{argmin}_z \|Az - y\|$. Ao escolher a norma, estamos efetivamente fazendo uma suposição sobre a distribuição estatística do ruído $v$.

\text{Minimize } \|u - b\| \text{ sujeito a } u \in \mathcal{A} \quad (\text{onde } \mathcal{A} = \text{Range}(A))